精品案例 | 数据分析岗位招聘情况及薪资影响因素分析
大家好,媛子小分队又跟大家见面了。又是一年招聘季,全国各高校都迎来了各行各业的公司进行宣讲会、招聘会。学生们摩拳擦掌,准备简历、面试;企业负责人们也都擦亮火眼金睛,想要找到他们最需要的人才。那么投身于数据分析浪潮的我们,将面临怎样的就业状况呢?
怎么样,跟数据分析有关的岗位还真是“雨后春笋”啊,有木有心中暗喜?但是看着如此多的机会,在小激动的同时,有没有点儿小迷茫、小懵圈?想不想知道数据分析岗位主要分布于哪些行业?我们要加强哪些方面的素质才能获得更高薪的工作?对于企业来说,又应该招聘怎样的人才?是更应看重应聘者的学历还是实战能力呢?对于不同背景不同条件的应聘者,应该怎样为其定制薪资?职场菜鸟和职场“高富帅”薪资有多大差距?对学校来说,在大数据的浪潮下,培养学生的方案怎样可以更适应社会的需求?
针对这些问题,媛子小分队基于2016年9月各大招聘网站发布的数据分析岗位招聘的相关信息,通过统计分析探究了数据分析岗位的招聘情况及薪资影响因素。从而使广大童鞋可以更好地定位自己,选择合适的工作,企业能招到合意的人才,同时学校也可以更有针对性地培养学生。
我们收集到共7493条招聘信息,覆盖北京、上海、深圳、山西、陕西以及河北六个地区,具体描述如下:
由于我们收集到的数据含有大量的文本,比如公司的行业类别,以及巨长无比的岗位描述等。这些文字里包含了大量我们需要的信息,因此我们首先对这些文本数据进行了词云分析,在公司行业类别和岗位描述中分别提取出出现频率最高的关键词,并对剩余关键词绘制词云图。
以岗位描述提取的关键词为例,我们发现用人单位非常注重应聘者的数据分析经验和数据挖掘能力,团队合作、沟通、协调以及执行力等也很重要。另外,独立、有责任心等品质也不容忽视;会操作各种统计分析软件也很吃香。
现在来考虑我们最关心的就职薪资的问题。由于原始薪资中存在很多登记过程中人为因素造成的异常值,后续分析将基于对数处理后的平均薪资。
接下来运用箱线图来分析薪资与各个因素(包括地区、公司类别、公司规模、经验要求、学历要求及软件要求等)之间的关系。以学历要求为例,从箱体的水平宽度可以看出,数据分析岗位大多要求中等学历,如大专及本科,要求硕博士或高中及以下的岗位较少。
另外,薪资会随学历水涨船高。对学历无特别要求以及要求最低学历在大专以下的岗位薪资水平差距不大,本科和硕士逐步提升,博士学历薪资则明显高于其他学历(虽然从箱体的水平宽度来看,要求博士的工作岗位还是灰常少滴,女博士含泪不语)。
为了解数据分析岗位的薪资究竟受到哪些因素的影响,以及量化影响程度,我们建立了回归模型进行进一步探究。
以软件要求为例,有12种软件出现在了岗位描述中,我们建立了12个虚拟变量来表示岗位是否要求掌握该软件的使用。如下柱状图表示了对应回归系数的估计:
可以看出,要求R,Java,SAS,Python,SQL以及Hadoop的数据分析岗位的需求通常为专业技术人才,故倾向于提供较高薪资。例如,要求Hadoop的数据分析岗位比未要求的平均薪资高23.6%。(插播技术党吐槽:虽然很多教材都提到,因变量进行对数变换后,估计系数可以像这样近似解释为因变量的增长率,但严格来说这只适用于估计系数较小的情形,其实增长率应该通过指数变换精确计算。吐槽完毕。)要求Excel技能的岗位薪资相对于无此要求显著为负,猜测因为指明要求Excel的岗位多为初级数据处理工作,因此薪资相对较低。其他的系数估计就不一一呈现咯。
媛子小分队做完这些挖掘和分析已经老眼昏花,那接下来很自然的问题是,做这些到底有啥用?(熊大敲黑板:数据产品的价值体现!价值体现!价值体现!)好吧,媛子继续自我折磨并折磨小分队成员。其实呢,这个分析产品还是有多种应用场景滴。首先可应用于应聘者的职业测评和用户画像:
以一个职场菜鸟为例,我们给出如下五维评分及用户画像:
而对于一个职场“高富帅”,他的画像可能长这样:
另外,该产品还可以通过回归模型的因变量区间预测为公司招聘定制薪资提供参考:
至于职场菜鸟和高富帅之间平均薪资差多少,媛子就卖个关子了,大家微店找答案呗。
最后,此产品对学校相关专业学生的培养方案可能有一丢丢的借鉴意义:
好啦剧透就到这儿啦,想知道我们的文本挖掘还有那些细节?具体的回归结果如何?博士生的薪资到底会比本科生高多少?是否大公司会提供更高的薪资?我们应该掌握哪些统计软件?或者,好奇职场菜鸟和高富帅的收入差距究竟有多少?那就请各位客官参看我们详细的案例报告吧
媛子小分队成员:媛子、段孙蓬、郝智慧、张晓晨、余婉露
点击“阅读原文”获取精品案例!